Analisando dados musicais com R

utilizando pacotes para processamento de texto

04/12/2024

Oi, eu sou a Bianca!

Bianca Muniz

  • 🎲 Jornalista pela USP, especialista em Jornalismo de Dados, Automação e Data Storytelling pelo Insper
  • Trabalho com jornalismo de dados na Agência Pública
  • 👩🏿‍🔬 Biomédica e mestre em Ciências pela Unifesp
  • ❤️ Amo desenhar, show, sescs e música emo

Objetivos

  • Explorar os pacotes tidytext, wordcloud,
  • Aplicar as funções em um corpus
  • Introduzir técnicas de análise de dados musicais.
  • Aplicar processamento de texto para explorar letras e metadados.
  • Usar pacotes do R para visualizações sobre músicas

Algumas definições

Tabset example

Content here for tabset 1 :)

More content here, for tabset 2 :)

Fontes de dados:

  • APIs (Spotify, Genius, Vagalume, etc.).

  • Planilhas com metadados musicais.

  • Rankings (Billboard, Spotify…)

  • Seus dados!

  • O que investigar em um dataset musical: Artista, Álbum, Ano, Letras, Gênero, Popularidade.

Pacotes úteis

  • tidyverse (manipulação de dados).

  • text (análise de texto);

  • ggplot2 (visualização).

  • tidytext (NLP para texto).

  • spotifyr (coleta de dados da API Spotify).

Exemplos e referências

tayloR

tayloR

Por que analisar texto é importante?

  • Sentimento, temas, frequência de palavras.

Fluxo de trabalho:

  • Limpeza e tokenização (tidytext);
  • Análise de frequência;
  • Nuvem de palavras e associações;
  • Análise de sentimentos em letras de músicas.

E o que vamos analisar hoje?